首页> 外文OA文献 >Constrained total undiscounted continuous-time Markov decision processes
【2h】

Constrained total undiscounted continuous-time Markov decision processes

机译:受约束的完全未折扣的连续时间马尔可夫决策过程

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

The present paper considers the constrained optimal control problem withtotal undiscounted criteria for a continuous-time Markov decision process(CTMDP) in Borel state and action spaces. Under the standard compactness andcontinuity conditions, we show the existence of an optimal stationary policyout of the class of general nonstationary ones. In the process, we justify thereduction of the CTMDP model to a discrete-time Markov decision process (DTMDP)model based on the studies of the undiscounted occupancy and occupationmeasures. We allow that the controlled process is not necessarily absorbing,and the transition rates are not necessarily separated from zero, and can bearbitrarily unbounded; these features count for the main technical difficultiesin studying undiscounted CTMDP models.
机译:本文考虑了在Borel状态和作用空间下连续时间马尔可夫决策过程(CTMDP)的总最优解约束条件下的最优控制问题。在标准紧致性和连续性条件下,我们证明了存在一般非平稳策略的最优平稳策略存在。在此过程中,我们基于对未占用空间和占用措施的研究,证明了将CTMDP模型归纳为离散时间马尔可夫决策过程(DTMDP)模型的合理性。我们允许受控过程不一定是吸收性的,过渡率不一定是零,并且可以任意限制。这些功能是研究未打折的CTMDP模型的主要技术难题。

著录项

  • 作者

    Guo, Xianping; Zhang, Yi;

  • 作者单位
  • 年度 2014
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号